Agent 时代已至：LLM 的下一步

周末看到两条新闻：

Anthropic 推出 Claude Opus 4.6 以及 Agent Teams 功能
OpenAI 发布 Frontier 平台，加速企业级 AI Agent 的部署

说实话，我并不意外。因为这一天，其实早就“一只脚踏出来了”。

先给自己脸上贴点金（笑）：
我在之前的文章里就提到过这个疑问——

Agent 是不是一条弯路？ 在反复读《Hello-Agents》之后，我反而开始怀疑，我们是不是在刻意回避一个更本质的问题：训练模型本身。

现在看，这些新闻更像是对那个判断的某种回应。

这只是第一步，而不是终局

目前，无论是 Anthropic 还是 OpenAI，本质上都还在做同一件事：

基于自有 LLM，构建深度耦合的 Agent 框架与工具链。

换句话说，是“用自己最懂的模型，去打磨最适合自己的 Agent 体系”。

从这个角度看，不管是 Manus、OpenClaw，还是其他第三方方案，又有谁能比大模型厂商自己更有说服力呢？

但这显然不是最后一步。

因为在我的设想里，他们现在提供的，仍然是Agent 框架本身：

要么是为自家模型深度优化的 Agent 架构
要么反过来，模型在训练阶段就已经针对这种架构做过 Agentic Reinforcement Learning

这两件事，本质上已经开始互相“咬合”。

题外话：DeepSeek 的一个细节，可能不是偶然

这里我想插一段题外话。

最近大家都在期待 DeepSeek 在春节期间发布 V4，也在猜它能 SOTA 多久。但我反而在想，它会不会走一条类似 Anthropic / OpenAI 的路径。

如果你去看 DeepSeek V3.1 / V3.2 的参数设置，会发现一个挺有意思的点：

上下文窗口长度在不断提升
但输出 max token 始终只有 8K
推理模式下虽然可以到 64K，但思维链本身会消耗大量 token

这意味着什么？

结合它的定价（输入 2 元 / MToken，输出 3 元 / MToken），你会发现：
它几乎没打算让你用它来做长文输出。

更合理的使用方式是：

组织一个很长、很复杂的上下文
用 8K 输出拿到结构化信息
再把结果喂回下一轮上下文

这本身就是一个典型的 Agent 设计思路。

所以我越来越觉得：这不是“限制”，而是某种有意为之的产品取向。我考虑用另一篇文章来完整表达一下我这部分思考

回到问题：个人开发者该怎么做 Agent？

思路拉回来。

如果你是个人开发者，或者像我一样的非专业开发者 Agent 发烧友，那问题就来了：

我们到底该以什么原则，来构建“只为自己服务”的 Agent？

我先抛砖引玉，给自己总结了几条原则。

原则一：不要幻想“什么都能帮我做”
目标一定要单一，路径一定要清晰。
Agent 一旦变成“万能助理”，基本就等于失控。

原则二：不造轮子，只造连接器
必须承认一件事：
我既写不出高深的 Agent 调度算法，也设计不好复杂的记忆系统。
那就老老实实，把现成的 Agent 框架、记忆框架按自己的需求连接起来。

原则三：不追求“最优 Agent”，而是“最适合自己工作流的 Agent”
把 Agent 当成“自动化自己”的工具，
而不是“模拟一个聪明的人”。

原则四：模块化设计 + 显式状态管理
从小工具开始，一步一步扩展。
每完成一个模块，都应该是可测试、可验收、可回滚的。

那企业呢？谁会真正被 Agent 改变？

如果你是企业员工（我就是），那另一个问题就绕不开了：

大型企业 vs 中小企业，在 Agent 这件事上的最优策略，真的一样吗？

我的判断可能有点激进：

未来 3–5 年，真正被 Agent 深度改变的，很可能不是大型企业，而是中小企业。

原因并不复杂。

大公司有很多“必须谨慎”的包袱：

数据合规风险
供应商锁定风险
遗留系统集成风险
组织与流程变更成本

而中小企业恰恰相反：

决策链短
容错空间大
流程本就不完善（反而好改）
几乎没有沉没成本

所以我甚至在想：
中小企业会不会最先，真正让 Agent 变成“直接干活的虚拟员工”？

不是辅助，不是建议，而是：

真的发邮件
真的改表格
真的跑脚本
真的对接客户

对他们来说：

60 分：已经值回票价
80 分：就是物超所值

他们不追求永不出错，只追求：
比人便宜 + 比人快 + 错了能改。

但这也引出了最后一个问题

中小企业的劣势也很明显：
他们没有资源，也没有意愿去自研 Agent 框架。

这也许正是 Anthropic 和 OpenAI 的目标：

用 Claude Code / Codex
配合自家的 Agent 平台
帮中小企业“低成本上线 Agent 能力”

可问题是：

那些非 LLM 厂商，如果要入局 Agent，
在底层能力明显不占优势的情况下，
他们还能靠什么策略破局？

是做垂直场景？
做流程整合？
还是干脆放弃“通用 Agent”，只做行业 Agent？

这个问题，我也还在想。
你们怎么看？